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摘要 : 抗体 是 获得 性 免疫 系统 的 主要 组 分 ,在 防御 性 及 致 病 必 


免疫 反应 中 起 着 关键 作用 。 对 抗体 发 生 ,发展 和 成 熟 过 程 的 解 


析 , 对 研究 传染 性 疾病 致 病 机 制 \, 疫 苗 设 计 、 自 免疫 疾病 发 生 及 进展 等 有 着 重要 意义 。 随 着 高 通 量 测序 技术 的 发 展 和 成 熟 , 抗 体 


研究 进入 了 组 学 时 代 。 通 过 对 艾滋 病 患 者 外 周 血 抗体 谱 的 高 通 量 测序 及 后 续 大 数据 分 析 挖 气 已 经 在 HIV-1 广 谱 抗体 研究 中 取 
得 了 丰硕 的 成 果 。 随 着 测序 技术 的 进一步 发 展 测序 长 度 的 增加 及 精度 的 提高 ,实验 体系 的 优化 ,分 析 流 程 标 准 的 建立 及 单 细 
胞 抗体 测序 技术 的 应 用 ,抗体 组 学 研究 前 景 广阔 。 本 文 就 抗体 组 学 的 技术 ,发展 ,应 用 及 问题 作 简要 综述 。 


关键 词 :高 通 量 测序 ;抗体 谱 ;获得 性 免疫 ;组 学 分 析 


Big data: the progress and applications of antibody repertoire sequencing 


ZHANG Zaibao, GUAN Qian, ZHANG Zhenhai 


State Key Laboratory for Organ Failure Research//National Clinical Research Center for Kidney Disease//Renal Division, Nanfang Hospital, 


Southern Medical University, Guangzhou 510515 China 


Abstract: Antibody, the major effector in adaptive immunity, plays key roles in protective and pathogenic immune responses. 


Integrative analyses of antibody development, differentiation, and maturation promote the research in immune mechanism, 
vaccine design, and therapies for autoimmune disorders. The development of next generation sequencing technologies has 


enabled large-scale characterization of functional antibody repertoires. With the advantages of next generation sequencing, 
antibody and antibody repertoire analysis have been successfully used in identification of HIV-1-broadly neutralizing 


antibodies, design of rationale structure-based vaccine, and development of immunology. With increasing sequence length and 
precision, improvement of experimental protocols and bioinformatics analyses, and development of single cell sequencing 
technology, antibody repertoire sequencing will expedite the research in antibody-related immune response, and thus 


facilitates vaccine design for infectious diseases, clinical diagnosis and interference of autoimmune diseases. This review 
introduces the technologies, progresses, applications, and caveats of antibody repertoire sequencing. 
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抗体 是 指 机 体 的 获得 性 免疫 系统 在 抗原 刺激 下 ,由 
B 淋 巴 细胞 经 历 产生 .成熟 增殖 分 化 并 分 泌 的 可 与 相 
应 抗原 发 生 特 异性 结合 的 一 类 免疫 球 和 蛋白”"。 抗 体 是 
由 两 条 完全 相同 的 重 链 和 两 条 完全 相同 的 轻 链 由 二 硫 
键 和 非 共 价 键 结合 2 形成 的 “Y" 形 对 称 结构 的 复合 物 ?。 

根据 理化 性 质 和 生物 学 功能 不 同 ,抗体 分 为 IgG、 
IgM IgA JIgD IgE 五 类 ( 表 1)。IgG 抗 体 占 血 清 I 总 量 
的 80% ,分 为 IgG1 IgG2 IgG3 IgG4 四 个 亚 类 ,是 机 体 
抗 感染 的 “主力 军 ”5。IgG 在 血清 中 持续 的 时 间 长 , 半 
衰 期 为 20~23 d, 是 唯一 能 在 母亲 妊娠 期 穿 过 胎盘 的 抗 
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体 。IgM 占 血清 Ig 总 量 的 5%~10%, 是 免疫 应 答 中 最 先 
分 泌 的 抗体 ,是 机 体 抗 感染 的 “先头 部 队 ”, 可 用 于 感染 
的 早期 诊断 号。IgA 抗 体 占 血清 Ig 总 量 的 10%~15%， 
分 为 单 体 型 IgA 和 分 泌 型 IgA。 分 泌 型 IgA 主要 分 布 于 
呼吸 消化 .生殖 等 管道 的 粘膜 表面 和 乳汁 .唾液 .泪液 
中 ,可 中 和 感染 因子 ,参与 局 部 粘膜 免疫 ,是 机 体 抗 感染 
Wy Soa, IgD 抗 体 占 血清 Ig 总 量 的 0.2% ,主要 出 现 
在 成 熟 的 B 淋 巴 细 胞 表面 上 ,与 B 细胞 的 分 化 相关 *。 
IgE 抗体 是 血清 中 含量 最 少 的 抗体 , 约 占 血清 Ig 总 量 的 
0.003% ,主要 由 粘膜 下 淋巴 组 织 中 的 浆 细胞 分 泌 , 参 与 
超 敏 反应 ,与 机 体 抗 寄 生 虫 免疫 相关 。 

抗体 是 B 淋巴 细胞 抗原 受 体 (B cell antigen 
receptor, BCR) 的 分 泌 形式 ,抗体 的 产生 和 成 熟 过 程 也 
就 是 B 细 胞 的 产生 发育、 增殖 和 分 化 的 过 程 *””。 其 重 
HEH V D JC 四 个 基因 片段 编码 的 , 轻 链 由 V JC = 
基因 片段 编码 。 成 熟 的 B 细 胞 从 骨髓 释放 到 外 周 血 中 ， 
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表 1 人 抗体 的 主要 理化 性 质 和 生物 学 功能 


Tab.1 Physicochemical property and biological function of human antibodies 


Class IgG IgM IgA IgD IgE 
Molecular weight (x10°) 150 950 160 184 190 
High chain y u a 6 8 
Isotypes 4 2 2 

Constitutes in serum ~80% 5%-10% 10%-15% 0.2% ~0.003% 
Functional form Monomeric Pentameric Monomeric/dimeric Monomeric Monomeric 
Half-life (day) 23 10 6 3 25 


Adaptive response 


Function a : 
anti-infection 


经 过 特异 性 抗原 的 刺激 后 会 进入 淋巴 结 的 生发 中 心 ,在 
生发 中 心中 经 过 细胞 增殖 体 细 胞 超 突变 、 亲 和 力 成 熟 、 
抗原 受 体 编辑 种 型 转化 等 复杂 事件 ,分 化 成 能 分 泌 特 
异性 抗体 的 浆 细 胞 和 少数 的 记忆 性 B 细胞 **”。 经 过 生 
发 中 心 的 体 细胞 超 突变 和 亲和力 成 熟 过 程 ,进一步 增加 
了 抗体 谱 (Antibody repertoire) 的 多 样 性 ,使 抗体 的 数 
量 达 到 了 10” 的 天 文 数字 ,并 提高 了 抗体 对 特异 性 抗 
原 的 亲和力 1。 

抗体 是 获得 性 免疫 的 主要 组 分 ,在 防御 性 及 致 病 性 
的 免疫 反应 中 起 关键 的 作用 。 通 过 对 抗体 发 生 ,发 展 和 
成 熟 过 程 的 解析 ,促进 了 对 传染 性 疾病 病理 机 制 .疫苗 
设计 、 自 免疫 疾病 治疗 等 免疫 学 相关 的 研究 。 例 如 , 通 
过 对 HIV-1 绥 慢 进展 患者 体内 中 和 广 谱 抗 体 产生 及 成 


Primary response 
early phase defense 


Allergies 


Unknown ; ‘ 
against parasites 


Mucosal immunity 


性 红斑 狼疮 和 风湿 性 关节 炎 ”。 

由 于 技术 的 低 通 量 性 ,每 次 实验 只 能 分 析 几 十 到 几 
百 个 B 细 胞 的 抗体 特性 ,与 抗体 谱 的 巨大 数据 相 比 , 低 
通 量 技术 只 为 我 们 揭示 了 冰山 的 一 角 。 


高 通 量 测序 在 抗体 组 学 中 的 应 用 

对 免疫 系统 的 认识 及 对 抗体 的 挖掘 及 应 用 需要 人 
们 能 全 面 深 入 的 了 解 抗 体 谱 的 整体 特征 , 因 通 量 限制 ， 
这 个 目标 是 传统 技术 无 法 实现 的 。 罗 氏 454 和 
Illumina Miseq 为 代表 的 下 一 代 测 序 技术 的 应 用 ,一 次 
测序 即 可 获得 数 以 百 万 计 的 B 细 胞 的 抗体 可 变 区 域 序 
列 。 结 合 分 子 标记 与 细胞 标记 技术 ,NGS 为 人 们 展示 
了 更 广阔 的 抗体 谱 特性 ,数据 量 更 加 接近 人 体 抗体 谱 真 


熟 通 路 的 解析 ,以 获得 具有 高 效 中 和 效应 的 HIV-1 特 异 
抗体 ,并 开始 应 用 于 HIV-1 疫 苗 的 研发 *""。 在 类 风湿 
性 关节 炎 自 免疫 疾病 中 ,自身 抗体 基因 IGHV4-34 明显 
富 集 , 可 以 作为 类 风湿 性 关节 炎 检 测 的 分 子 标 记 和 免疫 
治疗 的 靶 点 吓 。 通 过 对 抗体 发 生 发 展 的 深入 及 全 面 解 
析 ,不 仅 能 增加 我 们 对 免疫 调节 的 认识 ,而 且 为 疾病 的 
治疗 和 疫苗 的 研发 等 临床 应 用 提供 新 的 技术 与 方案 , 引 
领 新 型 治疗 性 抗体 研究 的 时 代 。 


低 通 量 测序 在 抗体 研究 中 的 应 用 

随 着 测序 技术 的 发 展 ,抗体 组 学 的 研究 经 历 了 从 低 
通 量 到 高 通 量 的 时 代 变 革 。 在 1990~2000 年 时 ,主要 利 
用 RT-PCR 扩 增 和 Sanger 测 序 技术 研究 少量 B 细胞 的 
抗体 特征 中 。 应 用 这 一 技术 ,人 们 开展 了 致 病 病 毒 如 
HIV-1 流感 病毒 的 单 克隆 抗体 和 自 免疫 疾病 相关 自身 
抗体 的 研究 。 通 过 抗体 测序 结合 克隆 表达 ,人 们 获得 了 
第 一 代 HIV-1 的 广 谱 抗 体 如 b12.4E10、2G12 等 抗体 7， 
解析 了 它们 的 抗原 识别 位 点 ,为 HIV-1 疫 苗 的 研发 提供 
本 指导“ 。 运 用 这 一 技术 ,Wardemann 等 "阐明 骨髓 
中 产生 自身 抗体 及 多 效 抗体 的 B 细胞 至 少 经 过 2 步 独 
立 的 自体 耐 受 性 的 检测 , 当 这 一 过 程 发 生 异 常 时 会 导致 
产生 分 泌 自身 抗体 的 浆 细 胞 ,诱发 自身 免疫 疾病 如 系统 


实数 量 , 使 抗体 的 研究 进入 了 大 数据 的 时 代 。 高 通 量 交 
据 的 捕获 也 使 得 研究 抗体 家 系 及 抗体 的 成 熟 途径 成 为 
现实 。 以 下 将 从 实验 的 操作 测序 平台 的 选择 .数据 的 
分 析 三 个 方面 详细 介绍 高 通 量 测序 在 抗体 组 学 中 的 进 
展 与 应 用 (图 1)。 

2009 年 Weinstein 等 ”首次 应 用 高 通 量 测序 技术 全 
面 研究 了 斑马 鱼 的 抗体 库 特 征 ,揭示 不 同 斑马 鱼 个 体 间 
重 链 VDJ 基 因 的 使 用 频率 存在 相似 性 ,促进 了 高 通 量 测 
序 技术 在 人 抗体 组 分 析 中 的 应 用 。 抗 体 的 高 通 量 测序 
需要 考虑 实验 设计 重 链 与 轻 链 配对 数据 的 分 析 挖掘 
及 可 视 化 等 问题 。 近 5 年 高 通 量 测序 技术 在 抗体 组 学 
的 应 用 可 以 分 为 2 个 时 期 :第 一 个 时 期 为 2009~2013 
年 ,利用 抗体 可 变 区 与 恒定 区 的 混合 引物 ,通过 梨 式 
PCR 从 外 周 血 单个 核 细 胞 cDNA 中 分 别 扩 增 抗体 重 链 
与 轻 链 基因 ,然后 通过 罗氏 454 测 序 平 台 测序 (图 1A)。 
应 用 这 一 技术 从 HIV-1 患者 中 分 离 出 了 中 和 力 更 强 的 
第 二 代 广 谱 中 和 抗体 ,如 VRC01、VRC03、 
CH103-CH106 CH01-CH04,10E8 等 。 结 合 结构 生物 
学 研究 者 解析 出 了 HIV-1 病 毒 4 个 重要 的 保守 表 位 结构 
域 ,分 别 是 CD4 结 合 表 位 .V1/V2 区 .V3 区 .gp41 和 蛋白 近 
膜 外 周 区 ”。 对 这 些 抗 体 成 熟 通 路 的 解析 及 HIV-1 保 
守 表 位 的 分 析 , 可 以 指导 HIV-1 疫 苗 的 设计 和 生产 ,从 
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而 为 预防 HIV-1 提供 了 新 的 思路 。 尽 管 这 些 方法 发 展 
迅速 ,但 仍 存在 诸多 问题 :如 混合 B 细胞 样本 增加 了 特 
异性 增殖 B 细胞 克隆 分 析 的 难度 ;设计 在 V 区 的 正 向 引 
物 并 不 能 覆盖 所 有 的 抗体 基因 片段 ,多 个 正 向 引物 的 混 
合 增加 了 PCR 的 偏好 性 ;尽管 可 以 从 混合 的 mRNA 样 
本 中 同时 测 出 抗体 的 重 链 与 轻 链 ,但 失去 了 体内 重 链 与 
轻 链 的 配对 信息 ;454 测 序 平台 容易 引入 碱 基 缺 失 与 捕 
入 ,增加 了 后 续 分 析 的 难度 。 

针对 以 上 问题 ,新 的 技术 被 开发 并 成 功 应 用 到 抗体 
测序 中 (图 1B-D)。DeKosky 等 ”通过 物理 方法 将 单个 
B 细 胞 中 的 重 链 与 轻 链 基因 连结 在 一 起 ,实现 了 内 源 重 
链 与 轻 链 的 配对 测序 (加 1B)。Robinsonso2 实验 室 通 
过 细胞 标记 的 方法 ,在 反 转 录 过 程 中 对 不 同 的 B 细 胞 
cDNA 产物 和 端 引入 特异 性 的 标记 ,有 利于 纠正 PCR 过 
程 及 测序 过 程 中 的 错误 ,并 保证 了 内 源 重 链 与 轻 链 的 配 
对 (图 1C)。 最 近 Georgiou5 实验 室 开 发 了 一 套 新 的 低 
花费 单 细胞 的 油 滴 PCR 技术 , 既 可 以 保持 体内 重 链 与 
轻 链 的 配对 又 实现 了 高 通 量 ,每 次 实验 可 以 分 析 多 达 
2x10' 个 B 细 胞 ,提高 了 测序 的 广度 与 深度 度 ( 图 1D)。 
5'RACE 技 术 的 应 用 ,解决 了 混合 引物 扩 增 的 偏好 性 问 
题 ,能 够 更 全 面 的 扩 增 到 抗体 基因 ,结合 PGM 与 
Ilumina MiSeq 平 台 提高 了 读 段 的 长 度 测序 的 深度 与 
数据 量 , 更 利于 抗体 组 的 高 通 量 分 析 “”。 因 此 , 单 细胞 
测序 、 重 链 与 轻 链 配 对 、5RACE、PGM 与 Ilumina 
MiSeq 平 台 应 用 ,将 进一步 推动 抗体 组 学 在 抗体 生产 、 
自 免疫 疾病 诊断 疫苗 生产 及 癌症 相关 疾病 的 研究 。 


抗体 组 学 的 生物 信息 分 析 

如 何 从 数据 的 海洋 中 挖掘 出 有 用 的 信息 ,用 于 指导 
抗体 的 生产 和 疫苗 的 设计 ,是 抗体 组 学 工作 中 面临 的 巨 
大 挑战 。 目 前 抗体 分 析 中 常用 的 软件 及 工具 如 图 2 所 
示 。 其 中 包括 的 主要 步骤 如 下 :对 测序 得 到 的 原始 数据 
(Raw reads) 进 行 质量 控制 , 滤 掉 质量 低 与 长 度 短 的 读 
段 并 获得 干净 的 数据 (Clean reads) ;利用 IgBlast 和 
IMGT 对 抗体 的 可 变 区 进行 V(D)J 生殖 系 基因 定位 
(VDJ annotation) 5; 根据 生殖 系 基 因 定 位 将 每 个 合并 
的 读 段 剪 切 至 恰好 包含 整个 可 变 区 域 ;去 除 元 余数 据 ， 
对 于 每 个 唯一 读 段 (Unique reads) 记 录 其 总 数量 ;系统 
化 注释 获得 reads 的 可 变 区 域 并 提取 CDR3 区 域 ;分 析 
CDR3 区 域 并 获得 抗体 的 家 系 信 息 (Clone or lineage) ; 
获得 每 个 家 系 中 轻重 链 可 变 区 域 的 序列 特性 ,并 利用 重 
链 和 轻 链 各 家 系 的 reads 数量 进行 轻重 链 配 对 ;对 配对 
好 的 抗体 序列 通过 实验 验证 功能 。 

利用 上 述 分 析 软 件 与 流程 ,人 们 开展 了 大 量 的 抗体 
相关 工作 的 分 析 , 促 进 了 数据 的 分 析 与 挖掘 并 加 快 了 免 
疫 学 的 进展 。 例 如 我 们 课题 组 最 近 参 与 的 HIV-1 中 和 
抗体 的 研究 ,通过 连续 15 年 样本 的 大 数据 量 的 分 析 , 解 


析 了 HIV-1 广 谱 中 和 抗体 VRC01 的 成 熟 与 变异 速率 ， 
结合 结构 生物 学 的 分 析 , 揭 示 了 VRC01 抗 体 的 进化 机 
制 ,对 开发 HIV-1 疫 苗 具 有 重大 的 意义 ””。 同 时 通过 对 
免疫 反应 中 抗体 谱 数据 特征 的 分 析 , 揭 示 了 年 龄 .遗传 
等 因素 对 抗体 产生 与 成 熟 的 影响 ,为 开发 相应 的 针对 不 
同人 群 的 有 效 疫 苗 提 供 了 指导 ”YY。 然 而 ,相对 于 高 通 
量 数据 的 快速 发 展 , 目 前 还 没有 一 个 统一 的 分 析 流 程 ， 
所 有 的 分 析 软 件 主 要 是 借助 了 一 些 免费 的 公用 软件 , 针 
对 抗体 分 析 的 专 一 性 软件 还 没有 开发 出 来 。 现 有 的 分 
析 流 程 也 存在 一 些 问 题 ,如 :IgBlast 和 IMGT 对 抗体 序 
列 进行 比 对 时 ,不 能 纠正 序列 中 的 错误 ,导致 比 对 的 不 
准确 性 ;由 于 D 基 因 较 短 ,IgBlast 和 IMGT 不 能 准确 地 
定位 D 基 因 ; 抗 体 成 熟 过 程 中 AID 酶 会 引入 新 的 突变 ， 
增加 了 抗体 的 多 样 性 并 提高 了 抗体 的 亲和力 ,然而 目前 
的 分 析 不 能 区 分 出 AID 所 介 导 的 突变 热点 ;家 系 进 化 树 
的 构建 完全 依赖 于 序列 相似 性 ,没有 考虑 原始 的 生殖 基 
AL AID 突变 的 偏好 (Hotspot) ,会 遗漏 掉 许 多 基因 并 
使 得 进化 树 不 能 完全 反映 细胞 内 重 链 与 轻 链 的 配对 情 
况 。 所 有 这 些 问 题 是 需要 下 一 步 抗体 数据 分 析 中 得 到 
解决 。 


展望 

从 以 上 对 抗体 组 学 的 发 展 及 应 用 简 述 中 可 以 看 到 ， 
结合 高 通 量 测序 的 抗体 组 学 具有 效率 高 ,深度 大 基因 
多 样 性 更 丰富 数据 反映 更 准确 等 优势 。 最 近 5 年 里 ， 
高 通 量 测序 的 抗体 组 学 分 析 已 经 成 为 免疫 学 的 热门 方 
法 ,促进 了 包括 抗体 发 生 ,疫苗 研发 ,肿瘤 发 生 及 自 免疫 
疾病 等 相关 免疫 学 的 研究 并 取得 了 众多 创新 性 的 成 
果 。 但 到 目前 为 止 ,抗体 组 学 分 析 的 应 用 潜力 还 远 未 发 
挥 出 来 ,其 技术 仍 受 到 一 些 现实 条 件 的 约束 ,如 高 通 量 
PCR 抗 体 基因 扩 增 技术 仍 不 够 完善 测序 读 段 长 度 与 准 
确 性 还 有 待 进一步 提高 ,标准 的 分 析 流 程 有 待 开发 完 
善 。 随 着 单 细胞 分 选 及 测序 的 应 用 .PCR 扩 增 基 因 方 法 
的 改善 ,细胞 标记 的 应 用 ,分 析 标 准 的 开发 ,未 来 抗体 组 
学 将 在 诊断 ,药理 学 ,疫苗 设计 及 临床 应 用 中 发 挥 前 所 
未 有 的 重大 作用 ,引领 新 型 治疗 性 抗体 研究 的 时 代 。 
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